طراحی و کاربرد روش سنجش انطباقی کامپیوتری برای اجرای آزمون تولیمو در سازمان سنجش آموزش کشور
author
Abstract:
سنجش مهارت زبان انگلیسی در ارزیابیهای خطیر به تعداد زیادی پرسش برای آزمونهایی بهشیوه مداد-کاغذی (P&P) نیاز دارد؛ زیرا هر سال افراد بسیاری در این نوع آزمونهای سرنوشتساز شرکت میکنند. هدف از اجرای این پژوهش، طراحی و کاربرد سنجش انطباقی کامپیوتری (CAT) بهعنوان گزینهای برای سنجش مهارت زبان انگلیسی در سازمان سنجش آموزش کشور بود. CAT برخلاف آزمونهای سنتی P&P که توالی گزینش پرسشها در آن ثابت و یکنواخت است، از یک شیوه گزینش سؤال بهینه و انطباقی استفاده میکند. CAT، برآورد توانایی موقت را بهطور بهینه مورد هدف قرار میدهد و به یک ملاک همگرایی مناسب برای برآورد توانایی میرسد و در نتیجه، به یک فرایند سنجش کوتاهتر، قابل اطمینانتر و کارآمدتر میرسد. مورد مطالعه مهارت زبان انگلیسی در مطالعه حاضر، آزمون تولیمو است. این پژوهش در دو مرحله اجرا شده است: در مرحله اول، نمونهای از اجراهای مداد-کاغذی آزمون تولیمو (دوره 114 تا 123)، انتخاب و سپس، سؤالها و توانایی آزمودنیها مدرجسازی شد. در مرحله دوم، CATهای بهینه شبیهسازی شده بهعنوان مبنایی برای ارزیابی صحت و کارایی CAT عملیاتی طراحی شدند. نتایج پژوهش نشان داد که برآورد پارامتر توانایی به روش بیشینه درستنمایی و ملاک توقف طول ثابت، بیشترین دقت در برآورد پارامتر توانایی آزمودنیها را ایجاد میکنند. همچنین، آزمون CAT تولیمو که بر اساس خزانه سؤال بهینه شبیهسازیشدند، نسبت به CAT عملیاتی که بر اساس خزانه سؤال موجود طراحی شده است، به سؤالهای کمتری نیاز دارد، درحالیکه به نتایج دقیقتری نسبت به CAT عملیاتی در برآورد پارامتر توانایی منجر میشود. بنابراین، باوجود مناسب بودن سؤالهای موجود در خزانه سؤال مدرجسازی شده آزمون تولیمو، طراحی سؤالهایی برای هدف اجرای آزمون به شیوه CAT، هم بهصرفهتر است و هم دقیقتر پارامتر توانایی را برآورد میکند. همچنین، نتایج این مطالعه نشان داد که آزمون تولیمو هم به شیوه CAT شبیهسازی شده و CAT عملیاتی طراحی شده به شکلی کارآتر و دقیقتر نسبت به تولیمو مداد-کاغذی عمل میکند. یافتههای این پژوهش، نشان میدهد که آزمون CAT تولیمو دارای پتانسیل بالایی در کارایی و دقت اندازهگیری توانایی زبان انگلیسی است.
similar resources
طراحی خزانههای سؤال بهینه برای سنجش انطباقی کامپیوتری با در نظر گرفتن امنیت آزمون
سنجش انطباقی کامپیوتری به خزانه سؤالی نیاز دارد که به خوبی طراحی شده و برای ساخت آزمونهای مجزا، تعداد مناسبی سؤال داشته باشد. همچنین شامل سؤالهایی باشد که از لحاظ محتوایی متعادل باشد و هزینه ساخت آزمون را کاهش دهد. یکی از روشهای طراحی خزانه سؤال، روش رِکیس است، که در آن از روش مونتکارلو برای تعیین ویژگیهای یک خزانه سؤال بهینه استفاده میشود. در این پژوهش، از این روش برای طراحی خزانه...
full textروش بهینه هموارسازی دادهها در همترازسازی: مورد مطالعه آزمون تولیمو و آزمونهای جامع کنکورهای آزمایشی سازمان سنجش آموزش کشور
این پژوهش با هدف یافتن بهترین روش هموارسازی داده ها در روشهای مختلف همترازسازی انجام شد. به این منظور از دادههای آزمون تولیمو و آزمونهای جامع کنکورهای آزمایشی شرکت تعاونی سازمان سنجش آموزش کشوردر سال 92-91 استفاده شد. برای تحلیل دادههای آزمونهای جامع کنکورهای آزمایشی شرکت تعاونی سازمان سنجش آموزش کشور صرفاً از سؤالات مشترک دروس عمومی رشتههای ریاضی- فیزیک، علوم تجربی و علوم انسانی استفاده شد. ...
full textتعیین روش بهینه شناسایی کارکرد افتراقی در سنجش انطباقی کامپیوتری
زمینه: یکی از چالشهای اساسی گذر از آزمونهای مداد – کاغذی به انطباقی کامپیوتری عادلانه بودن است که ارزیابی آن در چارچوب کارکرد افتراقی ضرورتی اجتنابناپذیر میباشد. هدف: هدف مطالعه حاضر بررسی کارکرد افتراقی، ارزیابی عوامل مداخلهگر در میزان آشکارسازی و معرفی روش بهینه مطالعه کارکرد افتراقی در سنجش انطباقی کامپیوتری بود. روش: با توجه به مسئله پژوهش از روش تجربی استفاده شد. گردآوری دادهها و دست...
full textتلفیق رویکرد ریکیسی و رویکرد برنامهنویسی ریاضی در طراحی خزانههای سؤال بهینه برای سنجش انطباقی کامپیوتری
سنجش انطباقی کامپیوتری (CAT) شیوهای از سنجش توانایی است که دقت برآورد توانایی را افزایش میدهد و بدون از دست دادن دقت اندازهگیری آزمون، طول آن را کاهش میدهد. با این وجود، سنجش انطباقی در صورتی خوب عمل میکند که، دارای خزانه سؤالی باشد که در آن تعداد کافی سؤال با کیفیت مناسب وجود داشته باشد. بسیاری از محققان خاطر نشان کردند که، برای ساخت خزانه سؤالی برای (CAT)، نه تنها اندازه خزانه سؤال مهم ...
full textروش بهینه همترازسازی با توجه به ویژگی های بومی آزمونهای ملی ایران: مورد مطالعه آزمون تولیمو و آزمون های جامع کنکورهای آزمایشی سازمان سنجش آموزش کشور
هدف از انجام پژوهش حاضر ارزیابی روشهای همترازسازی نمره مشاهده شده کلاسیک و روش کرنل ke بر حسب خطاها و سوگیری و همچنین بررسی عواملی بود که می تواند بر صحت روشهای همترازسازی متفاوت تأثیر داشته باشد. این پژوهش به طور دقیق تر با هدف بررسی و کاوش سودمندی و مناسب بودن روش ke (با شیوه های مختلف هموارسازیchain و poststratification) و همچنین مزایا و معایب این روش در مقایسه با تکنیک های همترازسازی کلاسیک...
15 صفحه اولتعیین مقایسهپذیری برآورد پارامتر توانایی در سنجش انطباقی کامپیوتری و مداد-کاغذی
هدف مطالعه حاضر تعیین مقایسهپذیری برآورد پارامتر توانایی در سنجش انطباقی کامپیوتری و مداد – کاغذی و تعیین الگوریتم بهینه آزمون انطباقی کامپیوتری بر اساس روشهای مختلف برآورد توانایی (بیشینه درستنمایی و پسین مورد انتظار) و ملاک خاتمه آزمون (خطای استاندارد ثابت و طول ثابت آزمون) در آزمونهای خطیر بود. جامعه پژوهش شامل تمامی شرکتکنندگان آزمون سراسری گروه آزمایشی علوم ریاضی و فنی سال 1392 بود که...
full textMy Resources
Journal title
volume 10 issue 29
pages 61- 144
publication date 2020-05-21
By following a journal you will be notified via email when a new issue of this journal is published.
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023